Un critère Bayésien pour évaluer la robustesse des règles de classification

نویسندگان

  • Dominique Gay
  • Marc Boullé
چکیده

Résumé. L’utilisation de règles de classification dans les modèles prédictifs a été très étudiée ces dernières années. La forme simple et interprétable des règles en font des motifs très populaires. Les classifieurs combinant des règles de classification intéressantes (selon une mesure d’intérêt) offrent de bonnes performances de prédictions. Cependant, les performances de ces classifieurs dépendent de la mesure d’intérêt (e.g., confiance, taux d’accroissement,. . . ) et du seuillage (non-trivial) de cette mesure pour déterminer les règles pertinentes. De plus, il est facile de montrer que les règles extraites ne sont pas individuellement robustes. Dans cet article, nous proposons un nouveau critère pour évaluer la robustesse des règles de classification dans les données Booléennes. Notre critère est issu d’une approche Bayésienne : nous proposons une expression analytique de la probabilité d’une règle connaissant les données. Ainsi, les règles les plus probables sont robustes. Le critère Bayésien nous permet alors d’identifier (sans paramètre) les règles robustes parmi un ensemble de règles données.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Mesure formelle de la robustesse des règles d'association

Résumé. Nous proposons dans cet article une définition formelle de la robustesse pour les règles d’association, s’appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l’évaluation des règles et n’a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règ...

متن کامل

Construction itérative d'un modèle de connaissance par l'exploitation de règles d'association

Résumé Nous nous intéressons à la construction itérative d’un modèle de la connaissance experte par l’exploitation de règles descriptives telles que les règles d’associations. Nous avons montré que, lorsqu’il est disponible, un modèle de type réseau bayésien facilite la présentation de règles d’association pertinentes. Nous étudions maintenant les possibilités pour l’expert d’annoter ces règles...

متن کامل

Sélection supervisée d'instances : une approche descriptive

Résumé. La classification suivant le plus proche voisin est une règle simple et performante. Sa mise en oeuvre pratique nécessite, tant pour des raisons de coût de calcul que de robustesse, de sélectionner les instances à conserver. La partition de Voronoi induite par les prototypes constitue la structure sous-jacente à cette règle. Dans cet article, on introduit un critère descriptif d’évaluat...

متن کامل

Un critère d'évaluation Bayésienne pour la construction d'arbre de décision

Résumé. Nous présentons dans cet article un nouvel algorithme automatique pour l’apprentissage d’arbres de décision. Nous abordons le problème selon une approche Bayésienne en proposant, sans aucun paramètre, une expression analytique de la probabilité d’un arbre connaissant les données. Nous transformons le problème de construction de l’arbre en un problème d’optimisation : nous recherchons da...

متن کامل

Critère VT100 de sélection des règles d'association

Résumé. L’extraction de règles d’association génère souvent un grand nombre de règles. Pour les classer et les valider, de nombreuses mesures statistiques ont été proposées ; elles permettent de mettre en avant telles ou telles caractéristiques des règles extraites. Elles ont pour point commun d’être fonction croissante du nombre de transactions et aboutissent bien souvent à l’acceptation de to...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011